Day 4 生成式AI的關鍵技術: 大型語言模型(LLM)(上) - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2024 iThome 鐵人賽

DAY 0

0

生成式 AI

除了ChatGPT，你了解生成式AI的其他應用嗎？30天從零到精通的學習與實作系列第 4 篇

Day 4 生成式AI的關鍵技術: 大型語言模型(LLM)(上)

16th鐵人賽

2024-09-18 23:07:30

675 瀏覽

分享至

大型語言模型(Large Language Model, LLM) 簡單來說

大型語言模型是一種利用大量文本資料訓練出來的人工智慧模型。當你給這個模型餵了大量的書籍、文章、網頁等文字資料，它就能學習這些文字的模式、語法、以及其中的知識，這彷彿就像一個博學多聞的人類一樣呢~

那具體來說，大型語言模型可以...

生成文字 : 根據使用者給予的指令，寫出各種風格的文章、創作劇本、故事，甚至程式碼。
翻譯、總結文章 : 將長篇大論的文章快速總結摘要、或是幫助快速翻譯文章。
回答問題 : 對使用者的問題提出相關的答案。

舉個例子，這是我叫Gemini幫我寫一首四言絕句的對答：

為什麼大型語言模型可以這麼厲害?

大量的資料： 它們接受了海量文本資料的訓練，掌握了豐富的知識。
預訓練與微調： 它們首先在大規模資料集上進行預訓練，學習語言的基本規則，然後透過少量特定資料進行微調，讓它們能夠適應不同任務的需求。
強大的計算能力： 它們需要強大的電腦來進行訓練和運算。

常見的大型語言模型有哪些?

GPT系列： 由OpenAI開發，在自然語言生成、對話、翻譯等方面表現出色，是目前最為知名的大型語言模型之一。
Gemini: 由Google DeepMind開發，是新一代的大型語言模型，結合了GPT和Transformer的優點，在多模態理解和生成方面表現出強大的能力。
LaMDA (Language Model for Dialogue Applications): 由Google AI開發，專注於對話生成，創造更自然、更開放的對話體驗。

今天簡單介紹了大型語言模型的功能應用與現在熱門的幾個模型，明天會講關於transformer模型的原理~

Day 3 生成式AI的工作原理: 從AI、機器學習講到生成式AI的運作方式

Day 5 生成式AI的關鍵技術: 大型語言模型(LLM)(下)

系列文

除了ChatGPT，你了解生成式AI的其他應用嗎？30天從零到精通的學習與實作共 30 篇

目錄

RSS系列文訂閱系列文

5 人訂閱

完整目錄

熱門推薦

{{ item.subject }}

{{ item.channelVendor }} | {{ item.webinarstarted }} |

{{ formatDate(item.duration) }}

直播中

尚未有邦友留言

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19838 篇

完賽人數

528 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙